专利摘要:
コンピュータ・システムの重複除外コンピュータ・ファイル・システムをバックアップするための方法およびシステムを提供する。例示的実施形態では、この方法およびシステムは、(1)ファイル・システムを区画に分割すること、および(2)それぞれの区画を別々のストレージ・メディア上に格納することを含む。
公开号:JP2011509459A
申请号:JP2010541046
申请日:2008-12-17
公开日:2011-03-24
发明作者:スミス、マーク、アンドリュー;ドリューズ、クレメンズ
申请人:インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Maschines Corporation;
IPC主号:G06F12-00
专利说明:

[0001] 本発明はコンピュータ・システムに関し、具体的には、コンピュータ・システムの重複除外(de-duplicated)コンピュータ・ファイル・システムをバックアップする方法およびシステムに関する。]
背景技術

[0002] コンピュータ・システムは、通常、コンピュータ・ファイル・システムを含む。このファイル・システムは重複除外ファイル・システムとすることができる。]
[0003] コンピュータ・システム(たとえばサーバ・コンピュータ・システム)は、データに対して効率的なデータ重複除外を実行する機能を必要とする。コンピュータ・ファイル・システムのためのバックアップ・ソリューションは、これまで、何らかの形のデータ「重複除外」またはデータ「冗長性削除」のアルゴリズムを含んできた。これらのアルゴリズムは、ファイル全体またはサブファイル・レベルで使用可能である。]
[0004] サブファイルの重複除外のための最も一般的な手法の1つが、第1に、ラビン指紋法(fingerprinting)などのデータ指紋法アルゴリズムを使用して、データ・ストリーム(ファイル)をチャンク(chunk)に分割することである。データ指紋法アルゴリズムは、アルゴリズムのパラメータに基づく「予測サイズ」のチャンクを生成するように設定することができる。ファイルがチャンクに分けられると、ハッシュ・アルゴリズムを使用して、それらのチャンクそれぞれのコンテンツが固有に識別される。次にこれらの固有識別子は、照会可能インデックス内に配置される。ファイル・システム内にすでに存在するチャンクが見つかった(インデックスの照会、または挿入の試行および衝突によって見つかった)場合、そのチャンクは、そのチャンクへの参照に置き換えることが可能であり、「重複除外」が発生する。チャンクに分けられたそれぞれのファイルについて、ファイルをその構成部分からどのように再構築するかを識別する、「青図面(blueprint)」またはチャンク・リストが生成される。]
[0005] この種の重複除外ファイル・システムに伴う1つの問題は、ストレージ・メディア(たとえばテープ・システム)を外すためにバックアップする際に、データ・ストレージ・フォーマットが、この重複除外状態の維持を非常に困難にすることである。データの相互接続性(オブジェクトの「青図面」が複数のチャンクを参照し、重複除外されたチャンクが複数のオブジェクトを逆に指示する)により、ストレージ・メディアを外すために重複除外システムをバックアップすることは困難である。単一オブジェクトの読み取りには、そのオブジェクトに関するデータを読み取るために複数のストレージ・メディアを取り付ける必要がある。]
[0006] 従って、ストレージ・メディアを外すために重複除外ファイル・システムをバックアップするための従来技術のシステムは、データの参照局所性が維持されるように、データを再重複させる。しかしながらこうしたシステムは、従来技術の図1に示されるように、ファイル・システムの重複除外状態を維持しながら、および参照局所性を維持しながら、重複除外ファイル・システムを取り外しメディアにバックアップすることができない。現在のところ、従来技術のシステムは、すべての重複除外ファイル・データにアクセスするために、独立ストレージ・メディアの取り外し/再取り付けを必要とする。] 図1
発明が解決しようとする課題

[0007] したがって、重複除外コンピュータ・ファイル・システムをバックアップするための方法およびシステムが望ましい。]
課題を解決するための手段

[0008] したがって本発明は、第1の態様において、ファイル・システムを区画に分割すること、および、それぞれの区画を別々のストレージ・メディア上に格納することを含む、コンピュータ・システムの重複除外コンピュータ・ファイル・システムをバックアップする方法を提供する。分割することは、グラフ区分アルゴリズムを使用することを含む。使用することは、ファイル・システムを相互接続性のないサブグラフに区分することを含む。区分することは、サブグラフ内のあるサブグラフを別々のストレージ・メディア上に完全に格納できない場合、サブグラフを接続させることになるデータを識別すること、および、サブグラフを接続させることになるデータを再重複させることを含む。この方法は、再重複されたデータを、すべての参照グラフ区画と共に保存することを含む。]
[0009] 好ましくは、識別することは、サブグラフを接続させることになるデータ・チャンクの最小セットを発見することを含む。]
[0010] 好ましくは、識別することは、高い参照カウントを伴うデータ・チャンクを選択することを含む。]
[0011] 好ましくは、格納することは、各メディアが満杯になるまで、別々のストレージ・メディア上の区画を組み合わせることを含む。]
[0012] 好ましくは、格納することは、最低量の区画間のグラフ相互接続性を伴い、別々のストレージ・メディア上で区画を保存することを含む。]
[0013] 好ましくは、保存することは、コンピュータ・システム上に同時に取り付け可能な別々のストレージ・メディアの数を調節すること、ならびに、別々のストレージ・メディアの取り外しおよび再取り付けのための性能ペナルティを考慮することを含む。]
[0014] 第2の態様において、コンピュータ・システムの重複除外コンピュータ・ファイル・システムをバックアップするシステムが提供され、システムは、ファイル・システムを区画に分割するように構成された分割モジュールと、それぞれの区画を別々のストレージ・メディア上に格納するように構成された格納モジュールと備える。分割モジュールは、グラフ区分アルゴリズムを使用するように構成された使用モジュールを備える。使用モジュールは、ファイル・システムを相互接続性のないサブグラフに区分するように構成された区分モジュールを備える。区分モジュールは、サブグラフ内のあるサブグラフを別々のストレージ・メディア上に完全に格納できない場合、サブグラフを接続させることになるデータを識別するように構成された識別モジュールと、サブグラフを接続させることになるデータを再重複させるように構成された再重複モジュールとを備える。システムは、再重複されたデータを、すべての参照グラフ区画と共に保存するように構成された保存モジュールをさらに備える。]
[0015] 好ましくは、識別モジュールは、サブグラフを接続させることになるデータ・チャンクの最小セットを発見するように構成された発見モジュールを備える。]
[0016] 好ましくは、識別モジュールは、高い参照カウントを伴うデータ・チャンクを選択するように構成された選択モジュールを備える。]
[0017] 好ましくは、格納モジュールは、各メディアが満杯になるまで、別々のストレージ・メディア上の区画を組み合わせるように構成された組み合わせモジュールを備える。]
[0018] 好ましくは、格納モジュールは、最低量の区画間のグラフ相互接続性を伴い、別々のストレージ・メディア上で区画を保存するように構成された保存モジュールを備える。]
[0019] 好ましくは、保存モジュールは、コンピュータ・システム上に同時に取り付け可能な別々のストレージ・メディアの数を調節するように構成された調節モジュールと、別々のストレージ・メディアの取り外しおよび再取り付けのための性能ペナルティを考慮するように構成された考慮モジュールとを備える。]
[0020] 第3の態様において、コンピュータ・システムにロードされ、そこで実行された場合に、第1の態様に従った方法のすべてのステップをコンピュータ・システムに実行させるためのコンピュータ・プログラム・コードを備える、コンピュータ・プログラムが提供される。]
[0021] コンピュータ・プログラムは、コンピュータ・システムの重複除外コンピュータ・ファイル・システムをバックアップする、内部で実施される読み取り可能プログラム・コードを有する、プログラマブル・コンピュータと共に使用可能なコンピュータ・プログラム製品として実施可能であり、コンピュータ・プログラム製品は、ファイル・システムを区画に分割するためのコンピュータ読み取り可能コードと、別々のストレージ・メディア上に各区画を格納するためのコンピュータ読み取り可能コードとを備える。]
[0022] 本発明は、コンピュータ・システムの重複除外コンピュータ・ファイル・システムを伝送するシステム内で実施可能であり、システムは、ファイル・システムを区画に分割すること、およびそれぞれの区画を別々の伝送チャネルについてアセンブルすることを含む。]
[0023] 本発明は、コンピュータ・システムの重複除外コンピュータ・ファイル・システムを伝送するシステム内で実施可能であり、システムは、ファイル・システムを区画に分割するように構成された分割モジュールと、それぞれの区画を別々の伝送チャネルについてアセンブルするように構成されたアセンブル・モジュールとを備える。]
[0024] 本発明の諸実施形態は、コンピュータ・システムの重複除外コンピュータ・ファイル・システムをバックアップする方法およびシステムを提供する。例示的実施形態では、方法およびシステムは、(1)ファイル・システムを区画に分割すること、および(2)それぞれの区画を別々のストレージ・メディア上に格納することを含む。]
[0025] 例示的実施形態では、分割することは、グラフ区分アルゴリズムを使用することを含む。例示的実施形態では、使用することは、ファイル・システムを相互接続性のないサブグラフに区分することを含む。]
[0026] 例示的実施形態では、区分することは、サブグラフ内のあるサブグラフを別々のストレージ・メディア上に完全に格納できない場合、(a)サブグラフを接続させることになるデータを識別すること、および、(b)サブグラフを接続させることになるデータを再重複させることを含む。例示的実施形態では、区分することは、再重複されたデータを、すべての参照グラフ区画と共に保存することをさらに含む。]
[0027] 例示的実施形態では、識別することは、サブグラフを接続させることになるデータ・チャンクの最小セットを発見することを含む。例示的実施形態では、識別することは、高い参照カウントを伴うデータ・チャンクを選択することを含む。]
[0028] 例示的実施形態では、格納することは、各メディアが満杯になるまで、別々のストレージ・メディア上の区画を組み合わせることを含む。例示的実施形態では、格納することは、最低量の区画間のグラフ相互接続性を伴い、別々のストレージ・メディア上で区画を保存することを含む。例示的実施形態では、保存することは、(a)コンピュータ・システム上に同時に取り付け可能な別々のストレージ・メディアの数を調節すること、ならびに、(b)別々のストレージ・メディアの取り外しおよび再取り付けのための性能ペナルティを考慮することを含む。]
[0029] 本発明は、コンピュータ・システムの重複除外コンピュータ・ファイル・システムをバックアップする、内部で実施される読み取り可能プログラム・コードを有する、プログラマブル・コンピュータと共に使用可能なコンピュータ・プログラム製品も提供する。例示的実施形態では、コンピュータ・プログラム製品は、(1)ファイル・システムを区画に分割するためのコンピュータ読み取り可能コードと、(2)別々のストレージ・メディア上に各区画を格納するためのコンピュータ読み取り可能コードとを備える。]
[0030] 次に、本発明の好ましい実施形態について、添付の図面を参照しながら単なる例として説明する。]
図面の簡単な説明

[0031] 従来技術を示す流れ図である。
本発明の例示的実施形態に従った流れ図である。
本発明の例示的実施形態に従った分割ステップを示す流れ図である。
本発明の例示的実施形態に従った使用ステップを示す流れ図である。
重複除外システムを示す図である。
本発明の例示的実施形態に従った、バックアップされた重複除外システムを示す図である。
本発明の例示的実施形態に従った、区分ステップを示す流れ図である。
本発明の他の実施形態に従った、区分ステップを示す流れ図である。
重複除外システムを示す図である。
本発明の例示的実施形態に従った、バックアップされた重複除外システムを示す図である。
本発明の例示的実施形態に従った、識別ステップを示す流れ図である。
本発明の例示的実施形態に従った、識別ステップを示す流れ図である。
本発明の例示的実施形態に従った、格納ステップを示す流れ図である。
本発明の例示的実施形態に従った、格納ステップを示す流れ図である。
本発明の例示的実施形態に従った、保存ステップを示す流れ図である。
本発明の例示的実施形態に従った流れ図である。]
実施例

[0032] 本発明の好ましい諸実施形態は、コンピュータ・システムの重複除外コンピュータ・ファイル・システムをバックアップする方法およびシステムを提供する。例示的実施形態では、方法およびシステムは、(1)ファイル・システムを区画に分割すること、および(2)それぞれの区画を別々のストレージ・メディア上に格納することを含む。]
[0033] 図2を参照すると、例示的実施形態において、本発明は、ファイル・システムを区画に分割するステップ212と、それぞれの区画を別々のストレージ・メディア上に格納するステップ214とを含む。本発明は、ファイル・システムの重複除外状態を可能な限り多く維持する。ファイル・システムはオブジェクト(たとえばコンピュータ・ファイル)を格納する。各オブジェクトは、少なくとも1つのデータ・チャンクを含む。ストレージ・メディアは、磁気ストレージ・メディア(たとえばテープ)または光ストレージ・メディア(たとえばDVD)とすることができる。例示的実施形態では、格納ステップ214は、他のストレージ・メディア上のデータ片を参照する必要がない。] 図2
[0034] ファイル・システムの分割
図3を参照すると、例示的実施形態において、分割ステップ212は、グラフ区分アルゴリズムを使用するステップ312を含む。たとえば本発明は、ダイクストラのアルゴリズムを使用することができる。本発明は、オブジェクトがそれらの構成チャンクに接続され、チャンクがそれらのメンバ・オブジェクトに逆に接続される、2部(2レベル)グラフとして、重複除外ファイル・システムに注目する。] 図3
[0035] 相互接続性のないサブグラフ
図4を参照すると、例示的実施形態において、使用ステップ312は、ファイル・システムを相互接続性のないサブグラフに区分するステップ322を含む。例示的実施形態では、サブグラフは区画である。] 図4
[0036] 図5を参照すると、たとえば重複除外ファイル・システムは、チャンク1および2(それぞれアイテム331および332)を含むオブジェクト1(アイテム330)、チャンク3、4、および1(それぞれアイテム351、352、および353)を含むオブジェクト3(アイテム350)、チャンク5、6、および7(それぞれアイテム341、342、および343)からなるオブジェクト2(アイテム340)、ならびに、チャンク6、7、および8(それぞれアイテム361、362、および363)からなるオブジェクト4(アイテム360)を含む。図5に示されるように、重複除外ファイル・システムは、アイテム331および353によって参照されるチャンク1(アイテム371)、アイテム332によって参照されるチャンク2(アイテム372)、アイテム351によって参照されるチャンク3(アイテム373)、アイテム352によって参照されるチャンク4(アイテム374)、アイテム341によって参照されるチャンク5(アイテム381)、アイテム342および361によって参照されるチャンク6(アイテム382)、アイテム343および362によって参照されるチャンク7(アイテム383)、ならびに、アイテム363によって参照されるチャンク8(アイテム384)を含む。図6を参照すると、例示的実施形態では、区分ステップ322は、図5に示された重複除外ファイル・システムを区画1(アイテム370)(サブグラフ)および区画2(アイテム380)(他のサブグラフ)に区分するため、結果として区画1(アイテム370)および区画2(アイテム380)には相互接続性がない。] 図5 図6
[0037] 相互接続性のあるサブグラフ
図7を参照すると、例示的実施形態では、区分ステップ322は、サブグラフ内のあるサブグラフを別々のストレージ・メディア上に完全に格納できない場合、サブグラフを接続させることになるデータを識別するステップ412、および、サブグラフを接続させることになるデータを再重複させるステップ414を含む。例示的実施形態では、サブグラフは、別々のストレージ・メディア上に収めることが可能な場合、十分に小さい。完全に分割できないか、または別々のストレージ・メディア上に収めるほど十分に小さくないグラフの場合、グラフのサブグラフを接続させることになるデータ片を識別し、各参照グラフ区画でストレージ用に再重複させることができる。] 図7
[0038] 図8を参照すると、例示的実施形態では、区分ステップ322は、再重複されたデータを、すべての参照グラフ区画と共に保存するステップ422をさらに含む。例示的実施形態では、本発明は、再重複されたデータをバックアップ・ターゲットに保存する。各グラフ区画は、別々のメディア(たとえば個々の磁気ストレージ・メディア(たとえばテープ)または個々の光ストレージ・メディア(たとえばDVD))上に格納可能であり、各グラフ区画は、そのグラフ区画が常駐する別々のメディア片上に含まれるデータのみを参照することになる。] 図8
[0039] 図9を参照すると、たとえば重複除外ファイル・システムは、チャンク1および2(それぞれアイテム431および432)を含むオブジェクト1(アイテム430)、チャンク3、4、および1(それぞれアイテム451、452、および453)を含むオブジェクト3(アイテム450)、チャンク5、6、および7(それぞれアイテム441、442、および443)からなるオブジェクト2(アイテム440)、ならびに、チャンク3、6、7、および8(それぞれアイテム461、462、463、および464)からなるオブジェクト4(アイテム460)を含む。図9に示されるように、重複除外ファイル・システムは、アイテム431および453によって参照されるチャンク1(アイテム471)、アイテム432によって参照されるチャンク2(アイテム472)、アイテム451および461(インスタンス相互接続性)によって参照されるチャンク3(アイテム473)、アイテム452によって参照されるチャンク4(アイテム474)、アイテム441によって参照されるチャンク5(アイテム481)、アイテム442および462によって参照されるチャンク6(アイテム482)、アイテム443および463によって参照されるチャンク7(アイテム483)、ならびに、アイテム464によって参照されるチャンク8(アイテム484)を含む。図10を参照すると、例示的実施形態では、たとえ図9の重複除外ファイル・システムが、チャンク3(アイテム473)がアイテム451および461の両方によって参照されている結果として生じる、相互接続性のインスタンスを含むとしても、区分ステップ322は、図9に示された重複除外ファイル・システムを区画1(アイテム470)(サブグラフ)および区画2(アイテム480)(他のサブグラフ)に区分するため、結果として、区画1(アイテム470)および区画2(アイテム480)は、アイテム473をチャンク3(アイテム485)内に再重複させることおよびチャンク3(アイテム485)をアイテム461によって参照可能にすることにより、相互接続性を持たないことになる。] 図10 図9
[0040] データの識別
図11を参照すると、例示的実施形態では、識別ステップ412は、サブグラフを接続させることになるデータ・チャンクの最小セットを発見するステップ512を含む。本発明は、最小カットを発見するために標準のグラフ・アルゴリズムを使用することによって、この発見ステップを実行することができる。本発明は、再重複させることが必要な最低量のデータを発見するために最小カット・グラフ区分アルゴリズムを使用することによって、この発見ステップを実行することができる。図12を参照すると、例示的実施形態では、識別ステップ412は、高い参照カウントを伴うデータ・チャンクを選択するステップ522を含む。特定のデータ・チャンクに関する参照カウントとは、そのチャンクがファイル・システム内のオブジェクトによって参照される回数のカウントである。特定のデータ・チャンクに関する参照カウントとは、そのチャンクを参照するファイル・システム内のファイル数のカウントでもある。] 図11 図12
[0041] 各区画の格納
図13を参照すると、例示的実施形態では、格納ステップ214は、各メディアが満杯になるまで、別々のストレージ・メディア上の区画を組み合わせるステップ610を含む。グラフ区画は、メディアが満杯になるまで別々のメディアの単一のインスタンス上で組み合わせることができるが、部分的な区画が別々のメディア片上に格納されることはない。] 図13
[0042] 図14を参照すると、例示的実施形態では、格納ステップ214は、最低量の区画間のグラフ相互接続性を伴い、別々のストレージ・メディア上で区画を保存するステップ712を含む。図15を参照すると、例示的実施形態では、保存ステップ712は、コンピュータ・システム上に同時に取り付け可能な別々のストレージ・メディアの数を調節するステップ722、ならびに、別々のストレージ・メディアの取り外しおよび再取り付けのための性能ペナルティを考慮するステップ724を含む。本発明は、(i)同時に取り付け可能な取り外しメディアの数と、(ii)別々のメディアの取り外しあるいは再取り付けまたはその両方のための性能ペナルティとに依存して、最低量のグラフ相互接続性を許容することができる。] 図14 図15
[0043] 伝送
本発明は、コンピュータ・システムの重複除外コンピュータ・ファイル・システムを伝送する方法およびシステムも提供する。例示的実施形態では、方法およびシステムは、(1)ファイル・システムを区画に分割すること、および(2)それぞれの区画を別々の伝送チャネルについてアセンブルすることを含む。図16を参照すると、例示的実施形態では、本発明は、ファイル・システムを区画に分割するステップ812、および、それぞれの区画を別々の伝送チャネルについてアセンブルするステップ814を含む。] 図16
[0044] 概要
本発明は、完全にハードウェア実施形態、完全にソフトウェア実施形態、またはハードウェアおよびソフトウェアの両方の要素を含む実施形態の、形を取ることができる。例示的実施形態では、本発明は、ファームウェア、常駐ソフトウェア、およびマイクロコードを含むがこれらに限定されない、ソフトウェア内で実装される。]
[0045] さらに本発明は、コンピュータ・システムまたは任意の命令実行システムによる使用のため、またはそれらに関連して、プログラム・コードを提供する、コンピュータ使用可能またはコンピュータ読み取り可能メディアからアクセス可能な、コンピュータ・プログラム製品の形を取ることができる。コンピュータ・プログラム製品は、本発明の方法を実装する命令を含む。コンピュータ使用可能またはコンピュータ読み取り可能メディアは、命令実行システム、装置、またはデバイスによる使用のため、またはそれらに関連して、プログラムを含むこと、格納すること、通信すること、伝搬すること、または移送することが可能な、任意の装置とすることができる。メディアは、電子、磁気、光、電磁、赤外線、または半導体のシステム(あるいは装置またはデバイス)、あるいは伝搬メディアとすることができる。コンピュータ読み取り可能メディアの例には、半導体またはソリッドステート・メモリ、磁気テープ、取り外し可能コンピュータ・ディスケット、ランダム・アクセス・メモリ(RAM)、読み取り専用メモリ(ROM)、剛性磁気ディスク、および光ディスクが含まれる。現行の光ディスクの例には、コンパクト・ディスク読み取り専用メモリ(CD−ROM)、コンパクト・ディスク読み取り/書き込み(CD−R/W)、およびDVDが含まれる。]
[0046] プログラム・コードの格納あるいは実行またはその両方に好適なコンピュータ・システムは、システム・バスを介してメモリ要素に直接または間接的に結合された、少なくとも1つのプロセッサを含む。メモリ要素は、プログラム・コードの実際の実行中に使用されるローカル・メモリと、大容量ストレージと、実行中に大容量ストレージからコードが取り出される回数を減らすために少なくとも一部のプログラム・コードの一時ストレージを提供するキャッシュ・メモリとを含む。入力/出力(I/O)デバイス(キーボード、ディスプレイ、ポインティング・デバイスなどを含むがこれらには限定されない)を、直接、または介在するI/Oコントローラを介して、コンピュータ・システムに結合することができる。コンピュータ・システムを、介在する専用または公衆ネットワークを介して他のコンピュータ・システムあるいはリモートのプリンタまたはストレージ・デバイスに結合できるようにするために、ネットワーク・アダプタをコンピュータ・システムに結合することもできる。モデム、ケーブル・モデム、およびイーサネット・カードは、現在使用可能なネットワーク・アダプタのタイプのうちのいくつかに過ぎない。コンピュータ・システムは、オペレーティング・システムおよびコンピュータ・ファイル・システムも含むことができる。]
权利要求:

請求項1
グラフ区分アルゴリズムを使用してファイル・システムを区画に分割するステップと、前記ファイル・システムを相互接続性のないサブグラフに区分するステップと、それぞれの前記区画を別々のストレージ・メディア上に格納するステップと、を含む、コンピュータ・システムの重複除外コンピュータ・ファイル・システムをバックアップする方法であって、前記区分するステップが、前記サブグラフ内のあるサブグラフを前記別々のストレージ・メディア上に完全に格納できない場合、前記サブグラフを接続させることになるデータを識別するステップと、前記サブグラフを接続させることになるデータを再重複させるステップと、前記再重複されたデータを、すべての参照グラフ区画と共に保存するステップと、を含む、方法。
請求項2
前記識別するステップが、前記サブグラフを接続させることになるデータ・チャンクの最小セットを発見するステップを含む、請求項1に記載の方法。
請求項3
前記識別するステップが、高い参照カウントを伴う前記データ・チャンクを選択するステップを含む、請求項1または2に記載の方法。
請求項4
前記格納するステップが、各前記メディアが満杯になるまで、別々のストレージ・メディア上の前記区画を組み合わせるステップを含む、前記請求項のいずれか一項に記載の方法。
請求項5
前記格納するステップが、最低量の前記区画間のグラフ相互接続性を伴い、別々のストレージ・メディア上で前記区画を保存するステップを含む、前記請求項のいずれか一項に記載の方法。
請求項6
前記保存するステップが、前記コンピュータ・システム上に同時に取り付け可能な別々のストレージ・メディアの数を調節するステップと、前記別々のストレージ・メディアの取り外しおよび再取り付けのための性能ペナルティを考慮するステップと、を含む、請求項5に記載の方法。
請求項7
ファイル・システムを区画に分割するように構成されたグラフ区分アルゴリズムを使用するように構成された使用モジュールを備える、分割モジュールと、前記ファイル・システムを相互接続性のないサブグラフに区分するように構成された区分モジュールと、それぞれの前記区画を別々のストレージ・メディア上に格納するように構成された格納モジュールと、を備える、コンピュータ・システムの重複除外コンピュータ・ファイル・システムをバックアップするシステムであって、前記区分モジュールが、前記サブグラフ内のあるサブグラフを前記別々のストレージ・メディア上に完全に格納できない場合、前記サブグラフを接続させることになるデータを識別するように構成された識別モジュールと、前記サブグラフを接続させることになるデータを再重複させるように構成された再重複モジュールと、前記再重複されたデータを、すべての参照グラフ区画と共に保存するように構成された保存モジュールと、を備える、システム。
請求項8
前記識別モジュールが、前記サブグラフを接続させることになるデータ・チャンクの最小セットを発見するように構成された発見モジュールを備える、請求項7に記載のシステム。
請求項9
前記識別モジュールが、高い参照カウントを伴う前記データ・チャンクを選択するように構成された選択モジュールを備える、請求項7または8に記載のシステム。
請求項10
前記格納モジュールが、各前記メディアが満杯になるまで、別々のストレージ・メディア上の前記区画を組み合わせるように構成された組み合わせモジュールを備える、請求項7から9のいずれか一項に記載のシステム。
請求項11
前記格納モジュールが、最低量の前記区画間のグラフ相互接続性を伴い、別々のストレージ・メディア上で前記区画を保存するように構成された保存モジュールを備える、請求項10に記載のシステム。
請求項12
前記保存モジュールが、前記コンピュータ・システム上に同時に取り付け可能な別々のストレージ・メディアの数を調節するように構成された調節モジュールと、前記別々のストレージ・メディアの取り外しおよび再取り付けのための性能ペナルティを考慮するように構成された考慮モジュールと、を備える、請求項11に記載のシステム。
請求項13
コンピュータ・システム内にロードされ、そこで実行された場合、請求項1から6のいずれか一項に記載の方法のすべてのステップを前記コンピュータ・システムに実行させるための、コンピュータ・プログラム・コードを備える、コンピュータ・プログラム。
类似技术:
公开号 | 公开日 | 专利标题
US10585857B2|2020-03-10|Creation of synthetic backups within deduplication storage system by a backup application
US10565166B2|2020-02-18|Determining chunk boundaries for deduplication of storage objects in a network computing environment
US9606740B2|2017-03-28|System, method and computer program product for synchronizing data written to tape including writing an index into a data partition
US9842152B2|2017-12-12|Transparent discovery of semi-structured data schema
US9613322B2|2017-04-04|Data center analytics and dashboard
US20190332489A1|2019-10-31|Selective Processing of File System Objects for Image Level Backups
US9158783B2|2015-10-13|Managing redundant immutable files using deduplication in storage clouds
US10031696B2|2018-07-24|Sub-lun input/output profiling for SSD devices
US10430398B2|2019-10-01|Data storage system having mutable objects incorporating time
US9632826B2|2017-04-25|Prioritizing deferred tasks in pending task queue based on creation timestamp
US8880482B2|2014-11-04|Replication of deduplicated data
US9507800B2|2016-11-29|Data management in distributed file systems
JP5732536B2|2015-06-10|重複排除に基づくストレージシステムにおけるスケーラブル参照管理のためのシステム、方法及び非一時的なコンピュータ可読ストレージ媒体
US9703803B2|2017-07-11|Replica identification and collision avoidance in file system replication
AU2012347883B2|2018-02-22|System and method for restoring application data
US8635187B2|2014-01-21|Method and system of performing incremental SQL server database backups
US8548953B2|2013-10-01|File deduplication using storage tiers
US8639669B1|2014-01-28|Method and apparatus for determining optimal chunk sizes of a deduplicated storage system
US9058298B2|2015-06-16|Integrated approach for deduplicating data in a distributed environment that involves a source and a target
US10628378B2|2020-04-21|Replication of snapshots and clones
US8364716B2|2013-01-29|Methods and apparatus for incrementally computing similarity of data sources
US8631052B1|2014-01-14|Efficient content meta-data collection and trace generation from deduplicated storage
KR100985169B1|2010-10-05|분산 저장 시스템에서 파일의 중복을 제거하는 장치 및 방법
US9110727B2|2015-08-18|Automatic replication of virtual machines
US7480643B2|2009-01-20|System and method for migrating databases
同族专利:
公开号 | 公开日
US20090177855A1|2009-07-09|
JP5398739B2|2014-01-29|
KR101369048B1|2014-02-28|
EP2240855A1|2010-10-20|
CN101911020A|2010-12-08|
KR20100099231A|2010-09-10|
CN101911020B|2013-10-02|
US8447938B2|2013-05-21|
WO2009087028A1|2009-07-16|
引用文献:
公开号 | 申请日 | 公开日 | 申请人 | 专利标题
JP2003524243A|2000-02-18|2003-08-12|アヴァマーテクノロジーズインコーポレイテッド|Hash file system and method used in commonality factoring system|
JP2007001168A|2005-06-24|2007-01-11|Canon Inc|画像処理装置|
JP2007001199A|2005-06-24|2007-01-11|Fuji Xerox Co Ltd|積層体、電子写真感光体、画像形成装置及びプロセスカートリッジ|
WO2007089502A1|2006-01-26|2007-08-09|Network Appliance, Inc.|Content addressable storage array element|
US20080288482A1|2007-05-18|2008-11-20|Microsoft Corporation|Leveraging constraints for deduplication|WO2013080464A1|2011-11-30|2013-06-06|International Business Machines Corporation|Optimizing migration/copy of de-duplicated data|
JP2015513741A|2012-02-29|2015-05-14|ネットアップ,インコーポレイテッド|重複排除のオペレーションを実行するためのフラグメンテーションのコントロール|
JP2016122480A|2010-12-17|2016-07-07|インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation|A program for restoring data objects from a backup device|JP3140906B2|1994-04-12|2001-03-05|株式会社エヌ・ティ・ティ・データ|システムファイルの更新及び復元方法|
AU5386796A|1995-04-11|1996-10-30|Kinetech, Inc.|Identifying data in a data processing system|
US5987506A|1996-11-22|1999-11-16|Mangosoft Corporation|Remote access and geographically distributed computers in a globally addressable storage environment|
US6047297A|1997-01-13|2000-04-04|Microsoft Corporation|Method and system for editing actual work records|
JP3563907B2|1997-01-30|2004-09-08|富士通株式会社|並列計算機|
US6374363B1|1998-02-24|2002-04-16|Adaptec, Inc.|Method for generating a footprint image file for an intelligent backup and restoring system|
US6047294A|1998-03-31|2000-04-04|Emc Corp|Logical restore from a physical backup in a computer storage system|
US6542975B1|1998-12-24|2003-04-01|Roxio, Inc.|Method and system for backing up data over a plurality of volumes|
US6856993B1|2000-03-30|2005-02-15|Microsoft Corporation|Transactional file system|
US6675177B1|2000-06-21|2004-01-06|Teradactyl, Llc|Method and system for backing up digital data|
US6788302B1|2000-08-03|2004-09-07|International Business Machines Corporation|Partitioning and load balancing graphical shape data for parallel applications|
US6781144B2|2000-11-20|2004-08-24|Konica Corporation|Radiation image radiographing cassette and radiation image reading apparatus|
US7222132B2|2001-03-20|2007-05-22|Swsoft Holdings, Ltd.|Common template file system tree for virtual environments and virtual servers|
US6985914B2|2002-02-20|2006-01-10|Emc Corporation|Cluster meta file system of file system cells managed by respective data movers of a network file server|
US20040015522A1|2002-06-13|2004-01-22|International Business Machines Corporation|Apparatus, system and method of providing a stackable private write file system|
JP3714479B2|2002-09-05|2005-11-09|広至 八十島|ネットワーク構造によるファイル管理方法、操作対象表示制限プログラムおよび記録媒体|
US7155465B2|2003-04-18|2006-12-26|Lee Howard F|Method and apparatus for automatically archiving a file system|
US7222143B2|2003-11-24|2007-05-22|Lenovo Pte Ltd.|Safely restoring previously un-backed up data during system restore of a failing system|
US20070088702A1|2005-10-03|2007-04-19|Fridella Stephen A|Intelligent network client for multi-protocol namespace redirection|
US8539481B2|2005-12-12|2013-09-17|Microsoft Corporation|Using virtual hierarchies to build alternative namespaces|
US20070204011A1|2006-02-28|2007-08-30|Maven Networks, Inc.|Systems and methods for offline access to video content of a web-site|
US8862841B2|2006-04-25|2014-10-14|Hewlett-Packard Development Company, L.P.|Method and system for scaleable, distributed, differential electronic-data backup and archiving|
US8190742B2|2006-04-25|2012-05-29|Hewlett-Packard Development Company, L.P.|Distributed differential store with non-distributed objects and compression-enhancing data-object routing|
US7689566B1|2006-12-12|2010-03-30|Sun Microsystems, Inc.|Method for defining non-native operating environments|
US7672981B1|2007-02-28|2010-03-02|Emc Corporation|Object classification and indexing of very large name spaces using grid technology|
US7873809B2|2007-03-29|2011-01-18|Hitachi, Ltd.|Method and apparatus for de-duplication after mirror operation|
US8315984B2|2007-05-22|2012-11-20|Netapp, Inc.|System and method for on-the-fly elimination of redundant data|
US20090132616A1|2007-10-02|2009-05-21|Richard Winter|Archival backup integration|
US7797279B1|2007-12-31|2010-09-14|Emc Corporation|Merging of incremental data streams with prior backed-up data|AT474261T|2003-01-31|2010-07-15|Visto Corp|Asynchrones echtzeit-abrufen von daten|
US8108446B1|2008-06-27|2012-01-31|Symantec Corporation|Methods and systems for managing deduplicated data using unilateral referencing|
US8660373B2|2008-07-22|2014-02-25|Xerox Corporation|PDF de-chunking and object classification|
US8621166B1|2009-02-09|2013-12-31|American Megatrends, Inc.|Efficient backup of multiple versions of a file using data de-duplication|
US8645334B2|2009-02-27|2014-02-04|Andrew LEPPARD|Minimize damage caused by corruption of de-duplicated data|
US8140491B2|2009-03-26|2012-03-20|International Business Machines Corporation|Storage management through adaptive deduplication|
GB2471715A|2009-07-10|2011-01-12|Hewlett Packard Development Co|Determining the data chunks to be used as seed data to restore a database, from manifests of chunks stored in a de-duplicated data chunk store.|
US20110060882A1|2009-09-04|2011-03-10|Petros Efstathopoulos|Request Batching and Asynchronous Request Execution For Deduplication Servers|
US8762338B2|2009-10-07|2014-06-24|Symantec Corporation|Analyzing backup objects maintained by a de-duplication storage system|
US8689045B2|2009-11-10|2014-04-01|LenovoPte. Ltd.|Apparatus and method for reloading software images|
US8407193B2|2010-01-27|2013-03-26|International Business Machines Corporation|Data deduplication for streaming sequential data storage applications|
US8370297B2|2010-03-08|2013-02-05|International Business Machines Corporation|Approach for optimizing restores of deduplicated data|
EP2548122A4|2010-03-16|2016-11-30|Copiun Inc|Highly scalable and distributed data de-duplication|
US20110276744A1|2010-05-05|2011-11-10|Microsoft Corporation|Flash memory cache including for use with persistent key-value store|
US9053032B2|2010-05-05|2015-06-09|Microsoft Technology Licensing, Llc|Fast and low-RAM-footprint indexing for data deduplication|
US8935487B2|2010-05-05|2015-01-13|Microsoft Corporation|Fast and low-RAM-footprint indexing for data deduplication|
EP2609517B1|2010-08-24|2020-04-01|BlackBerry Limited|Constant access gateway and de-duplicated data cache server|
US8682873B2|2010-12-01|2014-03-25|International Business Machines Corporation|Efficient construction of synthetic backups within deduplication storage system|
US9218343B2|2010-12-20|2015-12-22|International Business Machines Corporation|Partition file system for virtual machine memory management|
US9110936B2|2010-12-28|2015-08-18|Microsoft Technology Licensing, Llc|Using index partitioning and reconciliation for data deduplication|
US9823981B2|2011-03-11|2017-11-21|Microsoft Technology Licensing, Llc|Backup and restore strategies for data deduplication|
US8538929B2|2011-07-07|2013-09-17|International Business Machines Corporation|Archiving de-duplicated data on tape storage media using graph partitions|
US9542413B2|2011-10-06|2017-01-10|Hitachi, Ltd.|Stored data deduplication method, stored data deduplication apparatus, and deduplication program|
US9575978B2|2012-06-26|2017-02-21|International Business Machines Corporation|Restoring objects in a client-server environment|
US20140250078A1|2013-03-01|2014-09-04|Storagecraft Technology Corporation|Multiphase deduplication|
US9575680B1|2014-08-22|2017-02-21|Veritas Technologies Llc|Deduplication rehydration|
US10423495B1|2014-09-08|2019-09-24|Veritas Technologies Llc|Deduplication grouping|
法律状态:
2011-10-12| A621| Written request for application examination|Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20111011 |
2013-05-15| A977| Report on retrieval|Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130515 |
2013-07-03| A131| Notification of reasons for refusal|Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130702 |
2013-09-10| A521| Written amendment|Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130909 |
2013-09-27| TRDD| Decision of grant or rejection written|
2013-10-02| A01| Written decision to grant a patent or to grant a registration (utility model)|Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131001 |
2013-10-31| A61| First payment of annual fees (during grant procedure)|Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131022 |
2013-11-01| R150| Certificate of patent or registration of utility model|Ref document number: 5398739 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
优先权:
申请号 | 申请日 | 专利标题
[返回顶部]